Fundamentos da Inferência Estatística
Análise de Dados Ambientais
Universidade Estadual de Feira de Santana (UEFS)
ESTATÍSTICA INFERENCIAL
Definição:
Inferência estatística refere-se aos resultados derivados da análise estatística dos dados coletados.
Ou seja, a inferência estatística advém de uma relação entre a teoria estatística e os dados reais.
Métodos** ****de**** ****inferência**** ****estatística**** ****para**** ****testes**** ****de**** ****hipóteses**
Testes** ****de**** ****hipóteses**
Hipótese
Testes** ****de**** ****hipóteses**
Passo a passo para o teste de hipóteses:
Crie uma ou mais hipóteses;
Colete dados úteis para testar as hipóteses criadas;
Análise seus dados com testes estatísticos adequados;
Avalie os resultados para ver se eles suportam as hipóteses iniciais.
Testes** ****de**** ****hipóteses**
Ao coletar dados, você se depara com duas possibilidades:
Hipótese Nula (Ho) O efeito não existe
Hipótese Alternativa (Ha) O efeito existe
Testes** ****de**** ****hipóteses**
Erro Tipo I: Rejeito a hipótese nula (Ho), quando Ho é verdadeira;
Afirmo que há efeito, quando não há Erro Tipo II: Aceito a hipótese nula (Ho) ; quando Ho é falsa
Afirmo que não há efeito, quando há Verdadeira
Falsa
Rejeito
Aceito
| Erro Tipo I | OK |
|---|---|
| OK | Erro Tipo II |
Testes** ****de**** ****hipóteses**
Erro Tipo I: Rejeito a hipótese nula (Ho), quando Ho é verdadeira;
Afirmo que há efeito, quando não há Erro Tipo II: Aceito a hipótese nula (Ho) ; quando Ho é falsa
Afirmo que não há efeito, quando há Você está grávido!
Você não está grávida!
Inferência** ****frequentista**** ****(valor-*****p*****)**
Ronald Fisher (1935)
Critério probabilístico objetivo (valor de *p** *< 0,05)
Teste de significância da hipótese nula (TSHN)
Inferência** ****frequentista**** ****(valor-*****p*****)**
O critério do valor-*p** *de Fisher assume, arbitrariamente uma probabilidade de 5%
de chance de erro na inferência
Método de inferência estatística mais empregado na Psicologia
Inferência** ****frequentista**** ****(valor-*****p*****)**
A cultivar Abacaxi BRS Ajubá apresenta maior nível (M = 6,32; DP = 1,33) de controle da fusariose quando comparada a cultivar Abacaxi BRS Vitória(M = 8.79; DP = 1.19; *p** *< 0,05);
Inferência** ****frequentista**** ****(valor-*****p*****)**
Todas as vezes que fazemos uma análise inferencial, você avalia se o efeito foi
estatisticamente significativo (*p** *< 0,05)
Inferência** ****frequentista**** ****(valor-*****p*****)**
Frequentemente usamos o valor de p como forma de inferência estatística, mas precisamos ter alguns cuidados
Erro** ****Tipo**** ****II:**
O poder de um experimento é a probabilidade de detectar um efeito do
tratamento, se estiver presente.
O efeito não existe
*p** *= 0,08
probabilidade de detectar o efeito
1 – 0,20 = 0,80.
(Cohen, 1988, 1992)
35
30
25
20
15
10
5
0
BRS Ajubá
BRS Vitória
Relação** ****direta**** ****entre**** ****** (significância)** ****e**** ** (poder b)
Pequena
Grande
Pequeno (sig)
Grande (n-sig)
Valor de p
Efeito alto
Efeito baixo
Efeito alto (erro tipo II)
Efeito alto
Efeito alto
Efeito baixo (erro tipo I)
Outras situações que nos leva a cometer Erro Tipo I e Erro Tipo II
Pressupostos dos testes não acatados
Amostras problemáticas (vieses de seleção)
Instrumento de pesquisa ruim
TAMANHO DA AMOSTRA
Erro Tipo I
Tamanho do efeito
O 𝑑𝑧 é uma medida padronizada da diferença entre duas condições em um estudo de medidas repetidas.
𝑑𝑧: quanto maior, mais facilmente detectável é a diferença, necessitando de menos amostras.
Erro Tipo I
O que é
A Distribuição Normal é uma das distribuições de probabilidade mais utilizadas para modelar fenômenos naturais.
Isso se deve ao fato de que um grande número de fenômenos naturais apresenta esse tipo de distribuição.
Como acontece
Como acontece a distribuição normal
O que é
O que é
Média
Média = 613 = 76,62
8
| 55 | 64 | 72 | 80 | 70 | 100 | 98 | 74 |
|---|
Desvio-Padrão
Estimativa de variabilidade em torno da média
Média
76cm
245 = 15,66
7
| 55 | 64 | 70 | 72 | 74 | 80 | 98 | 100 |
|---|
A curva normal é definida por meio de duas informações: média e desvio-padrão
Média = 170; DP = 5,72
Frequência (n)
+-1 DP (68.3%) = [164,28– 175,72]
+-2 DP (95,4%) = [158,56– 181,44]
+-3 DP (99,7%) = [152,84 – 187,16]
DESVIOS DE DISTRIBUIÇÃO DE NORMALIDADE
Renda no Brasil
Mais pobres
Mais ricos
Quantidade de pessoas
Renda
DESVIOS DE DISTRIBUIÇÃO DE NORMALIDADE
DESVIO POR ASSIMETRIA
DESVIOS DE DISTRIBUIÇÃO DE NORMALIDADE
DESVIO POR CURTOSE
Leptocúrtica: Dados muito concentrados junto à media;
Mesocúrtica: Distribuição normal
Platicúrtica: Dados muito dispersos; muitas pessoas muito afastadas da média.
TESTANDO A DISTRIBUIÇÃO NORMAL NO JASP
Luiz Diego Vidal - vidal.center@academico.ufs.br - CPF: 033.281.915-93
COMO SABER SE SEUS DADOS SÃO NORMALMENTE DISTRIBUÍDOS?
Critérios** ****descritivos**** (****Tabachnick**** ****and**** ****Fidell****, 2019)**
Transforme o escore da Assimetria e Curtose em escore Z
Calcule: Assimetria e Curtose / Erro padrão
Valor maior que |1.96| é significativo *p** *< .05
Valor acima que |2.58| é significativo *p** *< .01
Valor acima que |3.29| é significativo *p** *< .001
COMO SABER SE SEUS DADOS SÃO NORMALMENTE DISTRIBUÍDOS?
Critérios** ****estatísticos**** ****(**Testes de significância)
Kolmogorov-Smirnov e Shapiro-Wilk
Hipotese nula: Dados não são normalmente distribuídos Espera-se rejeitar a hipótese nula → Dados são normalmente distribuídos
Nos testes de K-S e S-W, espera-se que *p** *> 0,05 (maior que) para acatar a distribuição de normalidade dos dados.
QUAIS DOS TESTES ESTATÍSTICOS UTILIZAR?
Obrigado!
Luiz Diego Vidal Santos
Universidade Estadual de Feira de Santana (UEFS)
UEFS — Análise de Dados Ambientais